期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于远距离监督和模式匹配的职衔履历属性抽取
于东, 刘春花, 田悦
计算机应用    2016, 36 (2): 455-459.   DOI: 10.11772/j.issn.1001-9081.2016.02.0455
摘要609)      PDF (1000KB)(915)    收藏
针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法。该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题分为两阶段。首先利用远距离监督知识和人工标注知识,挖掘具有高覆盖度的模式库,用于发现职衔履历属性和抽取候选集;其次利用职衔机构等属性间的文字接续关系,以及特定人物与候选属性的依存关系,设计候选集的过滤规则对候选项进行筛选,实现高准确度的属性抽取。实验结果显示,所提方法在CLP2014-PAE测试集上的 F值达到55.37%,显著高于评测最好成绩( F值34.38%)和基于条件随机场(CRF)的有监督序列标注方法( F值43.79%),表明该方法能高覆盖度挖掘并抽取非结构化文档中的职衔履历属性。
参考文献 | 相关文章 | 多维度评价